有限高斯混合模型聚类算法的研究

有限高斯混合模型聚类算法的研究

作者:师大云端图书馆 时间:2020-10-31 分类:硕士论文 喜欢:1779
师大云端图书馆

【摘要】聚类分析一直以来是统计学中一个重要的组成部分,伴随信息技术的快速发展,数据量的迅猛增加,聚类分析对于数据的处理和分析越来越重要。基于模型的聚类算法近年来得到了广泛的关注。它的主要思想是:假设数据服从某一个混合分布,每个类别可以用混合模型的分支去拟合,通过估计该混合模型的参数,然后判断数据属于哪一类别,进而完成聚类。而最为常用的是高斯混合模型。当高斯混合模型的阶数大于一并且为有限时,为有限高斯混合模型。其聚类过程对于模型参数的估计一般借助于EM算法。EM算法是缺失数据下的参数极大似然估计的迭代算法,它是一种常用的数据添加算法,其核心思想是通过利用已有的先验知识来迭代似然函数,让其收敛于某个最优值,通过利用EM算法可以极大的简化有限高斯混合模型聚类算法中参数估计的过程。本文总结了目前基于有限高斯混合模型聚类算法的研究现状,深入研究了有限高斯混合模型聚类算法和聚类过程中借助EM算法对参数进行估计的原理,结合目前在有限高斯混合模型聚类算法的研究方向,以有限高斯混合模型聚类算法中EM算法对初始化敏感、容易陷入局部最优和运行速度慢三个方面为切入点,提出相应的改进算法。一是提出一种简单、有效、计算量小的基于三分位数的EM算法初始化方法;二是在对于模型参数的估计提出Bootstrap-EM算法,避免EM算法陷入局部最优同时提高参数估计精度;三是将EM算法与PCA相结合,提出PCA-EM算法,可以有效的提高算法聚类精度和运行速度,解决了当数据集因为协方差奇异而导致EM算法无法进行迭代的问题。经过编程,在R软件中对以上所提出的算法利用UCI上的四个数据集进行了验证分析。结果表明,所提出的几种算法可以有效的解决有限高斯混合模型聚类算法过程中EM算法所存在的问题,并且提高了聚类结果的准确率。
【作者】古俊哲;
【导师】李振东;
【作者基本信息】兰州商学院,统计学,2014,硕士
【关键词】聚类;有限混合高斯模型;EM算法;初始化;Bootstrap-EM;PCA-EM;

【参考文献】
[1]刘小斌.我国刑事司法中舆情之非理性表现的法学剖析[D].复旦大学,法律,2012,硕士.
[2]陈元兵.射阳县汽运物流有限公司发展战略问题研究[D].新疆大学,工商管理,2013,硕士.
[3]南晓敏.前纵隔占位性病变的CT诊断[D].山东大学,临床医学(专业学位),2013,硕士.
[4]冯婧.针刺舞蹈震颤控制区联合美多巴对帕金森病小鼠脑内BDNF-TrkB信号转导通路的影响[D].北京中医药大学,中西医结合基础,2014,硕士.
[5]陈凤娇.中高级英美留学生语气词使用偏误分析及教学建议[D].广东外语外贸大学,汉语国际教育,2013,硕士.
[6]黎菊.小麦黄花叶病的发生监测及防控技术研究[D].南京农业大学,植物保护,2013,硕士.
[7]熊世海.重庆市科技金融成长及绩效研究[D].重庆大学,金融学,2014,硕士.
[8]侯春杰.基于遗传算法的无刷直流电机自适应模糊控制[D].河南科技大学,控制理论与控制工程,2013,硕士.
[9]阎龙,王发展,史耀耀.基于非等距偏置的纤维铺放路径规划算法研究[J].航空学报.
[10]于萍.中等职业学校课程开发能力研究[D].华东师范大学,职业技术教育学,2013,硕士.
[11]张文英.SmBiO_3和YBiO_3缓冲层的化学溶液沉积法快速制备及机理研究[D].西南交通大学,凝聚态物理,2013,硕士.
[12]傅颖.地方政府环境责任研究[D].浙江大学,环境与资源保护法学,2012,硕士.
[13]赵燕伟,李文,张景玲,任设东.多车型同时取送货问题的低碳路径研究[J].浙江工业大学学报,2015,01:18-23.
[14]李利如.有机太阳能电池的电极修饰及其性能的研究[D].河南大学,2013.
[15]李琳.新时期基层政府应急管理研究[D].中共湖南省委党校,行政管理,2013,硕士.
[16]杨天民.朱庆澜将军于陕西[J].文博.2005(05)
[17]张丽.葛根素蚕蛹油混悬剂口服生物利用度及抗氧化损伤功能的研究[D].浙江理工大学,生物化学与分子生物学,2012,硕士.
[18]李亦琛.水性聚氨酯涂层材料及其性能研究[D].武汉理工大学,2014.
[19]陈新.宜宾市物业管理行业现状调查及发展研究[D].西南交通大学,工商管理(专业学位),2013,硕士.
[20]王心爽.长沙市流动幼儿的心理健康状况及对策研究[D].湖南师范大学,学前教育(专业学位),2014,硕士.
[21]朱菲菲.言语和图形创造性思维个体差异的大脑结构基础及其异同[D].西南大学,基础心理学,2014,硕士.
[22]侯彬.基于稀疏表示的典型相关分析算法研究[D].南京理工大学,模式识别与智能系统,2013,硕士.
[23]胡飞.石墨带叠层复合结的电子输运性质[D].湘潭大学,凝聚态物理,2011,硕士.
[24]殷珊娱.二维斑点追踪技术对甲状腺功能低下患儿左室纵向收缩功能的评价[D].吉林大学,临床医学,2013,硕士.
[25]钱诚.转录因子Foxp3在子宫腺肌病局部组织中的表达及意义[D].宁波大学,外科学,2013,硕士.
[26]周溪溪.交叉口处公交车排放测算的延误修正模型研究[D].北京交通大学,2014.
[27]姜春林,鞠树成.略论网络信息计量学及其对科学计量学的影响[J].情报杂志,2004,01:21-22+25.
[28]程佳.玉米须提取物降血糖活性研究[D].吉林大学,食品工程,2014,硕士.
[29]范展滔,罗伟胜.数据挖掘方法在日负荷预测中的应用[J].电力标准化与计量,2003,04:36-39.
[30]赵彬.我国影子银行体系监管研究[D].内蒙古大学,公共管理,2014,硕士.
[31]胡子龙.我国产业集群升级过程中的技术创新与制度创新融合研究[D].太原科技大学,产业经济学,2013,硕士.
[32]葛丽娜.基于人工免疫的入侵检测模型与方法研究[D].广西大学,2004.
[33]朱庆生,邹景华,张江.基于动态网站的语义数据挖掘模型研究[J].计算机工程与应用,2005,17:167-169+196.
[34]韩萌.多元时间序列数据挖掘中相似性算法的研究[D].兰州理工大学,计算机应用技术,2014,硕士.
[35]张健.尿液中AD7c-NTP水平诊断阿尔茨海默病准确性的系统评价[D].广西医科大学,神经病学(专业学位),2013,硕士.
[36]王兆彬.睡眠监测与干预系统的设计与实现[D].华中科技大学,生物医学工程,2013,硕士.
[37]韩冰.受贿罪与相关犯罪认定案例分析[D].兰州大学,法律,2012,硕士.
[38]崔海瑞,宋悦,袁兵,赵海军,富昊伟,舒庆尧.植物DNA错配修复缺陷及其对诱变育种的意义[J].核农学报,2014,09:1606-1614.
[39]刘楠.运用词块教学法促进高中英语写作教学的行动研究[D].首都师范大学,学科教学,2013,硕士.
[40]陈争.电子政务公房管理系统的集成设计与实现[D].华侨大学,计算机技术(专业学位),2013,硕士.
[41]记者苏卫东.招商与招才并举引资与引智并重[N].无锡日报,2015-06-16001.
[42]张超.王廷相气理之学探微[D].辽宁大学,中国哲学,2012,硕士.
[43]丁丽.《翻译的重要性》(第一、二章)翻译报告[D].四川外国语大学,翻译(专业学位),2014,硕士.
[44]张武根.海域价格及其影响因素研究[D].南京师范大学,人文地理学,2012,硕士.
[45]韦秀磊.基于64V/60Ah锂电池组电池管理系统设计[D].河北大学,测试计量技术及仪器,2014,硕士.
[46]蔡大风.杭州地区居住建筑墙体节能设计研究[D].浙江大学,建筑技术,2004,硕士.
[47]方煜翔.microRNA-7在肝癌生长及转移过程中的调控作用研究[D].复旦大学,遗传学,2012,博士.
[48]周长喜.中学化学教学中学生问题意识的培养研究[D].内蒙古师范大学,学科教育(专业学位),2012,硕士.
[49]李智博,李德强.关于辽阳老工业基地振兴科技行动的建议[J].决策咨询通讯.2005(06)
[50]刘春秀.生在无可选择的世界-《苏菲的选择》中苏菲悲剧命运的解读[D].河南科技大学,英语语言文学,2014,硕士.

相关推荐
更多